3.2 Neyman-Pearson理论

1 问题提法原假设与对立假设

假设检验问题

有样本 $X \in X$ . 只知道 $X$ 的分布属于分布族 ${F_{θ} | θ \in Θ}$ . $Θ_{H}$ 是 $Θ$ 的一个非空真子集, 则 $H : θ \in Θ_{H}$ (存在 $θ_{0} \in Θ_{H}$ , 使 $X$ 的分布为 $F_{θ_{0}}$ )称为一个**(原/零)假设**. 记 $Θ_{K} = Θ - Θ_{H}$ , 则 $K : θ \in Θ_{K}$ 称为 $H$ 的对立/备选假设.
表述 $\begin{matrix} (1.1) & H : θ \in Θ_{H} \leftrightarrow K : θ \in Θ_{K} \end{matrix}$ 称为一个假设检验问题. 我们需要根据样本 $X$ 的取值选择接受或否定 $H$ (也即接受 $H, K$ 中的一个).

与前面的提法不同的是, 这里明确提出了对立假设, 可以对同一假设不同检验的优劣进行比较.

例子

继续考虑这个例子. 用 $X$ 表示女士说对的杯数. 若 $H$ 成立, $X$ 有超几何分布 $P (X = i | H) = (\binom{4}{i}) (\binom{4}{4 - i}) / (\binom{8}{4}) (i = 0, 1, \dots, 4) .$ 如何提出对立假设? 一种可能的提法为, $p_{i} + p_{i + 1} + p_{4} \geq \sum_{j = 1}^{4} (\binom{4}{j}) (\binom{4}{4 - j}) / (\binom{8}{4}),$ 其中等号至少对 $i = 1, 2, 3, 4$ 中的一个成立. 再比如说, 可以提 $H : E X = 2 \leftrightarrow K : E X > 2$ .

2 否定域检验函数

否定域检验函数随机检验

(1.1) 的假设检验事实上就是寻找一个法则, 根据样本决定接受或者否定 $H$ . 因此可以把 $X$ 分解为互不相交的 $X_{1}, X_{2}$ , 样本属于 $X_{1}$ 时接受 $H$ , 属于 $X_{2}$ 时否定 $H$ . 因此 $X_{2}$ 称为检验的否定域; $X_{1}$ 称为接受域.
进一步推广为: 检验是函数 $φ : X \to [0, 1]$ . $φ$ 表示有了样本 $x$ 后否定 $H$ 的概率, 称为检验函数. 如果 $φ (x) = 1$ , 否定 $H$ ; $φ (x) = 0$ , 接受 $H$ ; $0 < φ (x) < 1$ , 安排随机试验, 使其中某个事件 $A$ 的概率为 $φ (x)$ , 看 $A$ 是否发生.

如果 $φ$ 取值只有 $0, 1$ , 称为非随机检验, 否定域就是 ${x | φ (x) = 1}$ .
否则存在 $φ (x) \in (0, 1)$ , 称为随机检验, 在实际中不常用.

3 两类错误与功效函数

将

$H$ 正确但被否定的检验称为第一类错误(弃真);
$H$ 不正确但被接受的检验称为第二类错误(采伪).

我们希望检验方法犯错误的概率尽可能的小.

功效函数

设 $φ$ 是检验 (1.1) 的一个检验函数, 称 $\begin{matrix} (3.1) & β_{φ} (θ) = P_{θ} (φ 否定 H) = E_{θ} (φ (X)), θ \in Θ \end{matrix}$ 称为 $φ$ 的功效函数.
如果 $φ$ 为非随机检验, 否定域为 $X_{2}$ , 则 $β_{φ} (θ) = P_{θ} (X \in X_{2}) .$

知道功效函数后, 可以计算出 $\begin{aligned} φ 犯第一类错误的概率 & = {\begin{aligned} β_{φ} (θ), θ \in Θ_{H}, \\ 0, θ \in Θ_{K}, \end{aligned} \\ (3.2) & φ 犯第二类错误的概率 & = {\begin{aligned} 0, θ \in Θ_{H}, \\ 1 - β_{φ} (θ), θ \in Θ_{K} . \end{aligned} \end{aligned}$

4 检验水平真实水平限定第一类错误概率的原则

水平

α

检验

$φ$ 犯第一类错误的概率如果总不超过 $α$ ( $\forall θ \in Θ$ ), 则称 $α$ 是检验 $φ$ 的一个水平, $φ$ 称为水平 $α$ 检验.

由 (3.2), 得 $α$ 是水平 $α$ 检验的充要条件是 $β_{φ} (θ) \leq α, θ \in Θ_{H} .$ 检验的水平自然不唯一, 把一个检验的最小水平 (取 $β_{φ} (θ)$ 的上确界 $sup {β_{φ} (θ) | θ \in Θ_{H}}$ ) 称为真实水平.

我们当然希望一个检验犯两类错误的概率都很小, 但是这不可能同时兼得. 因此我们通常限定第一类错误的概率上界为 $α$ (设置门槛如 $0.05, 0.01, 0.005$ 等, 而又以 $0.05$ 最多), 然后尽可能减小第二类错误的发生概率.

1 问题提法 原假设与对立假设

2 否定域 检验函数

3 两类错误与功效函数

4 检验水平 真实水平 限定第一类错误概率的原则

1 问题提法原假设与对立假设

2 否定域检验函数

4 检验水平真实水平限定第一类错误概率的原则